Le jeu de données analysé est le résultat du UK Butterfly Monitoring Scheme, une démarche qui comme son nom l’indique vise à surveiller l’évolution des populations de papillons au Royaume-Uni. Les observations qui y sont recueillies balaient une préiode allant de 1973 à 2015.
Le jeu de données est accessible depuis le lien suivant : http://api.gbif.org/v1/occurrence/download/request/0001358-190415153152247.zip
En raison du poids de ce dernier (2.5 Go pour près de 6 millions de lignes, de quoi mettre à genoux nos pauvres machines pour générer la carte interactive, notamment sur le html accessible via github…), seule une fraction (les 100 000 premières lignes) en a été utilisée.
GBIF.org (18th April 2019) GBIF Occurrence Download https://doi.org/10.15468/dl.nzyl42
La carte interactive ci-dessous présente les localisations des différentes occurences d’espèces. La couleur varie en fonction de l’année d’observation (plus l’observation est récente, plus la couleur est foncée).
m<-leaflet(dataset) %>%
addTiles() %>%
addCircles(lng=~Longitude,lat =~Latitude,
color=~couleurs(year), opacity = 0.3)%>%
addLegend(pal = couleurs, values = ~year, opacity = 0.9)
m
Ce graphique présente le nombre d’observations réalisées chaque année.
g1<-ggplot(dataset,aes(x=year)) +
geom_line(stat="count",color="#69b3a2",linetype = "solid") +
ggtitle("Occurences par an") +
xlab("Année") +
ylab("Nombre d'occurrences") +
theme_ipsum()
ggplotly(g1)
Le graphe suivant présente les espèces de papillons ayant connu le plus d’observations depuis la mise en place du programme.
g2<-ggplot(dataset %>% group_by(species) %>% filter(n() > 100), aes(x=species)) +
geom_histogram(stat="count",fill="skyblue1") +
ggtitle("Occurences par espèce (au moins 100 occurences)")+
theme_ipsum()
ggplotly(g2)